Vector Embedding TagZH

大型语言模型（LLMs）通过生成类似人类的文本、回答复杂问题和分析大量信息以令人印象深刻的准确性，改变了自然语言处理（NLP）领域。它们处理各种查询并生成 ...

嵌入是数据的数值表示，捕捉了单词或短语的语义本质。这些嵌入被编码为高维向量，可以在各种数据应用中进行高效处理。嵌入可以根据所使用的模型而有所不同。如果使用不同的模型生成，相同的文本可能具有不同的嵌入。虽然文本数据是主要关注的对象，但嵌入不仅限于文本信息 ...

揭示力量：余弦相似度 vs 欧几里得距离

在现代数字时代，个性化建议对于增强用户互动至关重要。例如，音乐流媒体应用程序利用您的听歌习惯来推荐与您的口味、流派或心情相符的新歌曲。然而，这些系统是如何决定哪些歌曲最适合您的呢？ <img src="../../assets/cosine-similarity-vs-euclidean-distance/transfo ...

使用Cohere和Hugging Face构建RAG应用程序

检索增强生成（RAG）是一种通过引用外部知识源来增强大型语言模型的技术。这种方法可以在不重新训练模型的情况下提供更准确和相关的响应。这是一种在各个领域中提高语言模型性能的经济高效的方式。在本博客中，我们将使用[Cohere的Command R模型](https:/ ...

语义搜索：比较最佳嵌入模型

在搜索技术领域，语义搜索以其改变游戏规则的特点脱颖而出。它超越了简单的关键词匹配，理解查询背后的意图和上下文。与仅依赖特定词语的传统方法不同，语义搜索深入挖掘搜索词的更深层含义。为什么语义搜索很重要想象一下搜索“附近最好的比萨饼”。通过语义搜索，结果不仅仅会列出那些确切包含这些词语的餐馆；它还会考虑到您的位置、偏好，甚至评论，提供量身定制的建议。这种个性 ...

理解向量索引

在数据库开发的早期阶段，数据存储在基本表中。这种方法很简单，但随着数据量的增长，管理和检索信息变得越来越困难和缓慢。然后引入了关系数据库，提供了更好的存储和处理数据的方式。关系数据库中的一个重要技术是索引，它与图书馆存储图书的方式非常相似。与查找整个图书馆不同，您可以直接找到所需书籍所在的特定部分。数据库中的索引以类似的方式工作，加快了查找所需数据的过程。在本博客中，我们将介绍向量 ...

MyScale与Jina AI：释放您的AI应用的巨大潜力

MyScale在最新版本的集成SQL向量数据库中引入了EmbedText函数。这个强大的功能将SQL查询的效率与最先进的AI驱动文本嵌入技术结合在一起，使您可以使用熟悉的SQL语法进行精确的文本匹配和高 ...

使用SQL和MyScale简化文本嵌入

MyScale最近推出了EmbedText函数，这是一个强大的功能，将SQL查询与文本向量化能力集成在一起，将文本转化为数值向量。这些向量有效地将人类感知的语义相似性映射到向量空间中的相似性。使用SQL熟悉的语法，EmbedText简化了向量 ...